查看原文
其他

字节陷舆论风波,OpenAI 调查其不当行为

推荐关注↓

转自:量子位(ID:QbitAI)

字节跳动,陷入大模型舆论风波。

据The Verge报道:

字节跳动一直在秘密使用OpenAI的技术,来开发自家大语言模型(LLM)。

而在此消息被披露不久,The Verge进一步称OpenAI已经暂停了字节跳动的账户

具体而言,OpenAI发言人Niko Felix发布的声明如下:

虽然字节跳动使用我们API的量很少,但我们已经暂停了他们的账户,同时我们会进一步调查。

如果我们发现他们的使用不符合规则,我们将要求他们进行必要的更改或终止他们的帐户。

这里提到的“规则”是指在OpenAI的服务条款中有一项明确的规定,那就是OpenAI提供的模型能力,不允许用来被“开发任何与之产品和服务形成竞争的 AI 模型”。

据了解,字节跳动是通过微软购买的OpenAI访问权限,但是微软也制定了与OpenAI同样的政策。

The Verge表示正在向微软做进一步的咨询,是否也会跟OpenAI采取同样的措施暂停字节跳动的账户。

那么,此次的抄袭风波具体是怎么一回事呢?

内部文件被曝光

根据The Verge的说法,证据是来自字节跳动的一份内部文件——海外版飞书Lark的聊天记录。

这份文件表明,字节跳动在代号为“种子计划”(Project Seed)基础大语言模型项目中,几乎是在每个开发阶段都依赖OpenAI的API来进行开发,包括训练和评估模型。

“种子计划”是大约在一年前启动,目前主要研发两个产品,一个是在国内已经上线的Doubao;另一个是针对商业用户的聊天机器人平台,目前正在开发中。

据称,参与“种子计划”的员工是深知过度依赖OpenAI API的后果,于是他们就开始讨论如何通过“数据脱敏”来粉饰证据。

以至于经常会出现员工达到OpenAI API的最大访问上限的情况。

更具体而言,字节跳动更多的是在“种子计划”的早期阶段使用了OpenAI的技术。

The Verge根据内部文件表示,字节跳动大约是在几个月前下达了“模型开发的任何阶段停止使用 GPT 生成的文本”的命令。

不过也正是在这个时候,字节跳动发布了自家大语言模型Doubao。

但The Verge表示即便到了这个时候,字节跳动依旧没有停止违规行为:

字节跳动继续以违反OpenAI和微软服务条款的方式使用 API,包括评估豆包背后模型的性能。

并且还表示一位对字节跳动内部情况有一手消息的人指出:

他们说他们想确保一切都是合法的,但他们实际上只是不想被抓住把柄。

字节跳动已作回应

在The Verge发出这篇报道之后,字节跳动发言人Jodi Seth做出了如下回应:

GPT 生成的数据在“种子计划”的早期开发中用于注释模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。

字节跳动得到了微软的授权,可以使用GPT API。

我们在非中国市场利用GPT支持我们的产品;但在中国市场,则是使用我们自研的模型来支持Doubao

微软方面,发言人Frank Shaw则表示:

像Azure OpenAI服务这样的Microsoft AI解决方案,属于我们的有限访问框架的一部分,意味着所有客户都必须申请并得到 Microsoft 的批准。

我们还制定了标准,并提供资源帮助客户负责任地使用这些技术,并符合我们的服务条款。

我们有流程来检测滥用,并在发现违反行为准则的公司时,将停止他们的访问权限。

参考链接:
[1]
https://www.theverge.com/2023/12/15/24003151/bytedance-china-openai-microsoft-competitor-llm
[2]https://openai.com/policies/business-terms


- EOF -

推荐阅读  点击标题可跳转

1、疯狂马斯克“下云”:X部分功能代码从70万行减少至7万

2、改了一行代码,数组遍历耗时从10.3秒降到了0.5秒

3、滴滴严重故障,罪魁祸首是底层软件 or “降本增笑”?

4、祖传“屎山代码”终于有解了,GitHub Copilot Chat

5、字节 PICO 大裁员:骨干离岗,P5悬了!


觉得本文有帮助?请分享给更多人

推荐关注「算法爱好者」,修炼编程内功

点赞和在看就是最大的支持❤️

继续滑动看下一个

字节陷舆论风波,OpenAI 调查其不当行为

向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存